企业空间采购商城存储论坛

首页 > Hadoop > 正文

大数据新手入门hadoop的初步理解

2014-11-24 01:13来源：中国存储网

导读：大数据新手入门hadoop的初步理解：hadoop的初步理解 1:hadoop到底是什么呢? hadoop是一个解决方案，是一个能够处理大数据量的的分布式处理系统。

大数据新手入门hadoop的初步理解

1:hadoop到底是什么呢，

他是一个解决方案，是一个能够处理大数据量的的分布式处理的解决方案，他是google的模仿衍生产品。

它是利用了google发表的Mapreduce论文编写变成模型和框架。 ?他主要是把大的任务分割小的任务，并把这些小的任务交给集群上的单点执行。

什么叫做Job呢，在MapReduce中，一个准备提交执行的应用程序叫做：job(作业,就像一个工程一样）,而Job呢，太大了，就会分割成成N份，执行于计算机各个节点上，而这种单元叫做 task（任务）。

Hadoop 提供的分布式文件系统（HDFS）主要是来处理各个节点上的存储，并实现了高吞吐率的数据编写。

简单的说，就是一个资源的存储，和一个资源的查找。

hadoop在分布式存储和分布式计算方面，Hadoop都是用了主/从（Master/slave）架构。这里面有一系列的后台（deamon）程序。不同的后台程序扮演者不同的角色，这些角色: NameNode secondaryNameNode,JobTracker,TaskTracker,DataNode，这些名字呢，只要碰过hadoop都会见到，在master节点上呢，主要有的是NameNode，secondaryNameNode，JobTracker,在slave节点上主要是由DataNode，tasktracker。

? ? ? ? ?Master节点，得看系统的大小，而进行不同的部署。当Master大的时候呢，可以对Master中的NameNode 和secondaryNameNode节点，和JobTracker分配部署在两台服务器上。

继续阅读

关键词 :: Hadoop安装大数据入门 hadoop原理

中国存储网声明：此文观点不代表本站立场，如有版权疑问请联系我们。

相关阅读

Ubuntu 12.04单机版环境中搭建hadoop详细教程

Ubuntu 12.04单机版环境中搭建hadoop详细教程，在Ubuntu下创建hadoop用户组和用，创建hadoop用户。

在MAC OS上安装hadoop的步骤分享-详细版

在mac os上安装hadoop的文章不多，本文安装环境的操作系统是 MAC OS X 10.7 Lion，共分7步，注意第三个配置在OS X上最好进行配置，否则会报错“Unable to load realm info from SCDynamicStore”。

深入Nutch index源代码解析二)

Nutch采用一个MR对爬取下来的文档进行清洗和封装成一个action列表。Nutch会将封装好的数据采用基于http的POST的方法发送一个请求数据包给solr的服务器，solr.commit();这个方法在前面一篇文章中解释有些偏差，solr的整个事务都是在solr服务器端的，这跟以前的的事务有所

hadoop学习笔记四配置hadoop的eclipse开发环境

、默认项目名称为MapReduceTools，然后在项目MapReduceTools中新建lib目录，先将hadoop下的hadoop-core-1.0.4.jar重命名为hadoop.core.jar，并把hadoop.core.jar、及其lib目录下的commons-cli-1.2.jar、commons-lang-2.4.jar、commons-configuration-1.6.jar、jackson-m

SAP设立大数据理事会，与Hadoop携手打造强大生态系统。

SAP特别设立了一个“大数据”合作伙伴理事会。该理事会致力于进行合作创新，研发基于SAP实时数据平台和Hadoop的新产品解决方案，探索新应用和架构

聚焦搜索，数智采购|2021第一届百度爱采购数智大会即将盛大开启

【聚焦搜索，数智采购】2021第一届百度爱采购数智大会即将于5月28日在上海盛大开启！

自主创新赋能信息技术产业发展紫晶存储亮相数字中国展会

本次大会上，紫晶存储董事、总经理钟国裕作为公司代表，与中国—东盟信息港签署合作协议

XSKY统一存储落地首都医科大学宣武医院

XEUS统一存储已成功承载宣武医院PACS系统近5年的历史数据迁移，为支持各业务科室蓬勃扩张的数据增量和访问、调用乃至分析需求奠定了坚实基础。

大兆科技携智慧医疗存储方案走进中华医院信息网络大会

大兆科技全方面展示大兆科技在医疗信息化建设中数据存储系统方面取得的成就。

德赛西威与华为签署全场景智慧出行生态解决方案合作协议

双方相信，通过本次合作，能够使双方进一步提升技术实力、提升产品品质及服务质量，为客户创造更大价值。

产品推荐

助力冬奥！深信服EDS存储携北京广播电视台带来超清赛事呈现

电脑卡？看来你需要一块好固态了！致钛PC005带你远离卡顿

云存储助力企业数字化转型,神州数码出席智能存储论坛

安克诺斯为智能汽车制造企业提供完整的数据保护解决方案

首富之子王思聪出镜BBC纪录片英文流利豪宅内景曝光

宜家不雅照事件全过程到底是不是炒作？

头条阅读

栏目热点

在线资源

HBase中文指南 Linux系统管理员手册 Linux命令大全 Linux调用大全 Backup Exec中文手册 TSM5.2中文手册比特币 Raid技术 Python教程 MySQL中文手册 2016大数据标准白皮书系统集成商资质查询存储百科存储器/芯片

关于我们 | 联系我们 | 广告服务 | 合作伙伴 | 网站地图 | 版权声明 | 隐私条款 | 在线投稿

Copyright @ 2006-2019 chinastor.cn 版权所有京ICP备14047533号

中国存储网

存储第一站，存储门户，存储在线交流平台